import pandas as pd
df = pd.DataFrame({'商品':['苹果','香蕉','梨','香蕉'],
                '单价(元)': [4,5,4,5],
                '销量(kg)': [100,120,105,120],
                '库存(kg)': [50,60,70,60]})
# print('源数据:\n',df)
# print('检查所有列的重复值:\n',df.duplicated())
# print('检查单价的重复值，标记除第一行的其他重复:\n',df.duplicated('单价(元)'))
# print('检查单价列的重复值:\n',df.duplicated('单价(元)',keep='last'))
# print('检查单价列的重复值,标记所有包含重复值的行为True:\n',df.duplicated('单价(元)',keep='last'))
print('删除单价列除包含重复值的第一行外其他包含重复值的行:\n',df.drop_duplicates('单价(元)'))
print('删除单价列除包含重复值的最后一行外其他包含重复值的行:\n',df.drop_duplicates('单价(元)',keep='last'))
print('删除完全重复的第一行外其他完全重复的行:\n',df.drop_duplicates())
print('删除所有完全重复的行:\n',df.drop_duplicates(keep=False))
print('删除所有完全重复的行,并重新设置连续行索引\n',df.drop_duplicates(keep=False,ignore_index=True))



import numpy as np
import numpy as pd
arr = np.arange(1,10).reshape(3,3)
df1 = pd.DataFrame(arr,columns=['a','b','c'])
df.insert(0,'key',['001','003','002'])
print('左对象原始数据df1:\n',df1)
arr2 = np.arange(10,14).reshape(2,2)
df2 = pd.DataFrame(arr2,cloumns=['a','e'])
df2.insert(0,'key',['001','004'])
print('右对象原始数据df2:\n',df2)